Index de l'AideTable des matières

Place de marché

La place su marché est un ensemble de scripts dans divers langages.

Nettoyage des données - remplacer les valeurs null par la moyenne.

Remplace les valeurs null d'une colonne par la moyenne de cette colonne.

  • Colonne numérique comportant des nulls comme entrée.
  • Colonne numérique comportant des moyennes à la place des nulls comme sortie.
  • Ce script permet d'éliminer les valeurs null (en les remplaçant par la moyenne).

Nettoyage des données - Remplacer les valeurs null par la médiane

Remplace les valeurs null d'une colonne par la médiane de cette colonne.

  • Colonne numérique comportant des nulls comme entrée.
  • Colonne numérique comportant des médianes à la place des nulls comme sortie.
  • Ce script permet d'éliminer les valeurs null (en les remplaçant par la médiane).

Nettoyage des données - Remplacer les valeurs null par zéro

Remplace les valeurs null d'une colonne par des zéros.

  • Colonne numérique comportant des nulls comme entrée.
  • Colonne numérique comportant des zéros à la place des nulls comme sortie.
  • Ce script permet d'éliminer les valeurs null (en les remplaçant par des zéros).

Remplacer les chaînes vides

Remplace toutes les chaînes vides par "Non trouvé".

  • Colonne nominale en entrée
  • Colonne nominale comportant dont les chaînes vides ont été remplacées par "Non trouvé" (ou n'importe quelle autre chaîne définie dans le script) comme sortie.

Nombres arrondis

Arrondit les nombres de la colonne donnée à l'entier le plus proche.

  • Colonne numérique en entrée.
  • Colonne numérique aux nombres arrondis avec la précision spécifiée (2,12345 e, précision 2 donne 2,12) en sortie.

Majuscules

Faire passer une colonne nominale en majuscules

  • Colonne nominale en entrée
  • Colonne nominale en majuscules en sortie.

Minuscules

Faire passer une colonne nominale en minuscules

  • Colonne nominale en entrée
  • Colonne nominale en minuscules en sortie.

Différences de date

Détermine les écarts entre les dates de lignes successives

  • Colonne de dates en entrée.
  • Colonne d'écarts entre les dates en sortie.

Nombres arrondis dans les chaînes

Recherche et arrondit tous les nombres d'une colonne nominale

  • Colonne nominale en entrée.
  • Colonne numérique aux nombres arrondis avec la précision spécifiée (2,12345 en précision 2 donne 2,12) en sortie.

Supprimer les lignes comportant des données manquantes

Supprimer les lignes comportant des données manquantes

  • N'importe quelles colonnes en entrée.
  • N'importe quelles colonnes en sortie, moins les lignes dépourvues de données.

Analyse de sentiment

Analyse chaque ligne de texte pour estimer si la phrase est positive ou négative en comptant les mots positifs et négatifs (les dictionnaires sont téléchargés à partir du site web Pyramid).

  • Colonne texte dont chaque ligne comporte plus d'un mot en entrée.
  • Colonne catégorielle avec catégories positive/négative en sortie.
  • Ce script peut être utilisé pour analyser les critiques de restaurants/livres, etc.

Créer annotation d'anomalie

Analyse les données numériques pour déterminer si une valeur constitue une anomalie.

Remarque : la sensibilité aux anomalies peut être modifiée en changeant la Limite supérieure des anomalies, augmenter cette valeur indiquera davantage d'anomalies et vice-versa.

  • Colonne numérique en entrée.
  • Colonne catégorielle avec catégories anomalie/non-anomalie en sortie.
  • Ce script peut servir à colorer les anomalies.

Créer annotation d'anomalie par écart-type

Si une anomalie est détectée et confirmée par écart-type, cette fonction crée une colonne avec une annotation est-anomalie.

Notez que la sensibilité aux anomalies peut être modifiée en changeant le nombre de l'écart-type. Augmenter cette valeur indiquera davantage d'anomalies, et la réduire en mettra moins en évidence.

  • Colonne numérique en entrée.
  • Colonne catégorielle avec catégories anomalie/non-anomalie en sortie.
  • Ce script peut servir à colorer les anomalies.

Retirer les valeurs les plus éloignées de la moyenne

Analyse les données numériques pour déterminer si une valeur constitue une anomalien et la remplacer par la moyenne si c'est le cas.

  • Colonne numérique en entrée.
  • Colonne numérique aux valeurs nettoyées en sortie.
  • Ce script peut servir à travailler avec des données plus propres.

Nettoyer le texte

Retirer tous les caractères non alphanumériques.

  • Colonne de texte à nettoyer en entrée.
  • Colonne de texte sans caractères non alphanumériques en sortie.
  • Ce script peut servir pour les données de santé des nourrissons.

Permutation de la matrice

Permuter la matrice - lignes en colonnes - colonnes en lignes

  • Matrice nXm en entrée, 3X3 dans le cas suivant, mais peut être modifiée.
  • Permutation de la matrice en sortie.

Matrice de différences

Retourne une matrice numérique indiquant la différence entre les lignes (au lieu des valeurs réelles).

  • Colonne numérique en entrée.
  • Matrice numérique indiquant la différence entre les lignes (au lieu des valeurs réelles) en sortie.

Méthode Mack Chain-Ladder

La méthode actuarielle Chain-Ladder est au premier plan de la constitution de réserves contre les pertes.

La méthode Chain-Ladder sert à la fois dans l'immobilier, la santé et l'assurance.

  • Trois valeurs numériques : temps d'accident (période), moment de déclaration de sinistre (période) et pertes en entrée.
  • Table d'échelle enchaînée en sortie.
  • Ce script peut être appliqué à des données d'assurance afin d'estimer les déclarations de sinistre futures.

Méthode LDF de Clark

Analysez le triangle de perte à l'aide de la méthode LDF (Loss Development Factor) de Clark

  • Trois valeurs numériques : temps d'accident (période), moment de déclaration de sinistre (période) et pertes en entrée.
  • Estimation LDF Clark en sortie.
  • Ce script peut être appliqué à des données d'assurance afin d'estimer les déclarations de sinistre futures.

Distance géographique

Calcule la distance entre deux lieux géographiques pour chaque ligne de données.

  • Deux lieux représentés par des colonnes de latitude et de longitude en entrée.
  • Distance entre les deux endroits en sortie.

Distance géographique depuis l'emplacement central

Calcule la distance entre un emplacement géographique sur chaque ligne et un emplacement central.

  • Lieu représenté par sa latitude et sa longitude en entrée.
  • Distance entre le lieu entré et le lieu central codé en dur dans le script en sortie.

Moyenne mobile

Calcule la moyenne mobile des N dernières lignes.

  • Colonne numérique en entrée et colonne servant à trier ( date)
  • Colonne pour la moyenne mobile en sortie.

Extraire données quotidiennes sur les actions

Téléchargement des données depuis le site web Yahoo, variations du nom de l'action, de la date de début et de celle de fin au besoin.

  • Colonne texte comportant les noms des actions en entrée.
  • Données Yahoo pour chacune des valeurs en sortie.

Pays à partir de l'adresse

Détermine le pays à partir de l'adresse (complète ou partielle).

  • Colonne textuelle d'adresses en entrée.
  • Colonne textuelle des pays en sortie.
  • Le script peut être utilisé quand l'adresse est disponible, mais pas le pays.

Adresse à partir des coordonnées

Détermine l'adresse correspondant à la latitude et à la longitude (coordonnées) des entrées de données.

  • Colonne de coordonnées (ou une colonne de latitude et une de longitude) en entrée.
  • Colonne textuelle de l'adresse correspondante.

Coordonnées à partir de l'adresse

Obtient les coordonnées à partir des adresses

  • Colonne textuelle d'adresses en entrée.
  • Colonne des coordonnées de chaque adresse en sortie.

Extraire données sur les actions

Extrait les données boursières de plusieurs actions sur une période donnée à l'aide de l'API financière de Google.

  • Identifiants des actions codée en dure ou colonne nominale des identifiants d'actions en entrée.

  • Tableau rassemblant les données boursières en sortie.
  • Télécharge le client Google Finance, Pandas.

Ratio de Sharpe

Calcule le ratio de Sharpe pour différents actifs financiers à partir d'une date précisée.

  • Colonne textuelle de noms d'actions en entrée.
  • Colonne numérique indiquant le ratio de Sharpe pour chaque action.

Analyse de panier

Analyse de panier estimant un groupe de produits pour indiquer le prochain groupe de produits qui sera acheté.

Remarque : il est nécessaire de modifier la première ligne de code en fonction de l'entrée, en ajoutant chaque produit au cadre des données.

  • 2 Colonnes d'entrée : 1. Numéro de transaction (Référence), 2. Nom de produit
  • Tableau de règles, de confiance, élévateur et support, avec le nom des produits dans chaque cellule.
  • Matrice booléenne N (inconnu), les lignes marquant une transaction avec chaque colonne représentant un produit différent en entrée. La matrice est remplie avec des valeurs vraies/fausses pour indiquer si un produit a été acheté lors de la transaction.

  • Tableau de règles, avec le nom des produits dans chaque cellule en sortie.

  • Ce script peut servir à analyser un groupe de produits.

Ratio rendement/risque

Calcule le ratio rendement/risque. Équivaut au ratio de Sharpe mais sans tenir compte du taux sans risque.

  • Vecteur avec un nom d'action en entrée.
  • Nouveau tableau comportant un nom d'action et son ratio rendement/risque en sortie.
  • Ce script importe des données de Yahoo et les dates de début et de fin peuvent être ajustées.

Clustering Birch

Met en œuvre l'algorithme de clustering Birch.

  • Les entrées sont : colonnes numériques (3 par défaut, modifiable).
  • Nouveau vecteur avec un nombre de cluster en sortie.
  • Clustering hiérarchique pour de grands ensembles de données.

Développeur d'enregistrements par mois

'Transformation de date de plage en colonne : colonnes date de début - date de fin vers colonne mensuelle.

  • Les entrées sont : Date de début (date), date de fin (date), Param1 (paramètre à développer).
  • Nouveau tableau avec une droite pour chaque mois entre les paires de dates en sortie.
  • Développeur général par mois (pour analyse ultérieure).

Développeur d'enregistrements par jours

'Transformation de date de plage en colonne : colonnes date de début - date de fin vers colonne journalière.

  • Les entrées sont : Date de début (date), date de fin (date), Param1 (paramètre à développer).
  • Nouveau tableau avec une droite pour chaque jour entre les paires de dates en sortie.
  • Développeur général par jour (pour analyse ultérieure).

Compteur 'Appli ouverte'

Compte le nombre de fois que l'application a été ouverte.

  • Ensemble booléen en entrée.
  • Nouvelle colonne avec un compteur de commutations en sortie.
  • Peut être utilisé pour un fournisseur d'application s'il est nécessaire de compter le nombre de fois qu'elle a été allumée.

Compteur de service

Compte le nombre de fois où le service a été demandé.

  • Ensemble booléen en entrée.
  • Nouvelle colonne avec un compteur de commutations en sortie.
  • Peut être utilisé pour un fournisseur d'application s'il est nécessaire de compter le nombre de fois où la permutation a été vraie.

Compteur de mois

Compte le nombre de mois et crée une table de décompte.

  • Colonne de date et d'heure en entrée.
  • Nouveau tableau avec un maximum de 12 lignes et un compteur pour chaque mois en sortie.
  • Ce script peut servir pour n'importe quelles entrées comportant une date et une heure pour lesquelles il faut établir des groupes suivant les mois.

Compteur de jours de la semaine

Compte le nombre de jours de la semaine et produit un tableau de décompte.

  • Colonne de date et d'heure en entrée.
  • Nouveau tableau avec un maximum de 7 lignes et un compteur pour chaque jour de la semaine en sortie.
  • Ce script peut servir pour n'importe quelles entrées comportant une date et une heure pour lesquelles il faut établir des groupes suivant les jours de la semaine.

Quantité rentable

Contribution unitaire du nouveau produit/contribution unitaire de l'ancien produit.

  • Trois ensembles numériques en entrée : coûtes fixes, prix unitaire moyen, coût unitaire moyen.
  • Colonne numérique contenant le ratio.
  • Ce script peut servir à analyser le taux de rentabilité de la cannibalisation (BECR).

Taux de cannibalisation rentable

Contribution unitaire du nouveau produit/contribution unitaire de l'ancien produit.

  • Deux ensembles numériques en entrée : contribution unitaire du nouveau produit et contribution unitaire de l'ancien produit.
  • Colonne numérique contenant le ratio.
  • Ce script peut servir à analyser le taux de rentabilité de la cannibalisation (BECR).

Estimation de la tension sanguine des nouveau-nés en fonction de leur masse corporelle

Estimation simple de la tension sanguine en fonction du poids corporel.

  • Colonne numérique du poids corporel en entrée.
  • Colonne numérique contenant la pression sanguine.
  • Ce script peut servir pour les données de santé des nourrissons.

Estimation du volume de globules rouges des nouveau-nés

Estimation simple du volume des globules rouges en fonction du poids corporel.

  • Colonne numérique du poids corporel en entrée.
  • Colonne numérique contenant le volume des globules rouges.
  • Ce script peut servir pour les données de santé des nourrissons.

 

Accueil | Table des matières | Index | Communauté d'utilisateurs
Pyramid Analytics © 2017-2019